Model Selection

TRL Fine-tuning

# TRL Fine-tuning

Qwen3 8B Grpo Medmcqa

A fine-tuned version based on Qwen/Qwen3-8B using the medmcqa-grpo dataset, specialized in medical multiple-choice question answering tasks

Large Language Model

Deepseek R1 Chinese Law

Llama model trained with Unsloth and Huggingface TRL library, achieving 2x faster inference speed

Large Language Model

Transformers English

Llama model trained with Unsloth and Huggingface TRL library, achieving 2x inference speed improvement

Large Language Model

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase